2
실험 4: 적대적 탐색 최적화
PolyU COMP55112026-02-2

휴리스틱 1: 위치 전략

표준 Minimax AI는 5개를 연속으로 만들었을 때만 승리했음을 인지합니다. 그 마지막 순간까지 보드의 모든 위치는 종종 "동일하게" (점수 0) 보이므로, 초반 게임에서 무작위로 움직이게 됩니다.

개념

  • 모든 빈칸이 동일한 것은 아닙니다. 구석에 놓인 돌은 약하며, 확장할 수 있는 방향이 적습니다.
  • 돌이 중앙에 있으면 강력합니다. 이는 수직, 수평 및 대각선 라인을 동시에 제어합니다.
  • 목표: AI가 승리 라인을 보기 전에도 중앙을 제어하도록 장려합니다.

구현: "히트맵"

"중심성" 기하학을 실시간으로 계산하는 것(느림) 대신, 미리 정의된 룩업 테이블을 사용합니다.

이것은 보드 크기와 일치하는 2D 행렬입니다. 숫자가 높을수록 더 가치 있는 전략적 위치를 나타냅니다. evaluate_board이 실행될 때, AI가 놓은 모든 돌에 대한 값을 간단히 조회합니다.